高通量测序技术的最新进展使得可以提取多个特征,这些特征描绘了以不同和互补分子水平的患者样本。此类数据的产生导致了计算生物学方面的新挑战,这些挑战涉及捕获多个基因及其功能之间相互关系的高维和异质数据集的整合。由于它们的多功能性和学习复杂数据的合成潜在表示的能力,深度学习方法为整合多词数据提供了有希望的观点。这些方法导致了许多主要基于自动编码器模型的许多原始体系结构的概念。但是,由于任务的困难,集成策略是基本的,而不是失去全球趋势而充分利用来源的特殊性。本文提出了一种新型策略,以构建可自定义的自动编码器模型,该模型适应高维多源集成而言使用的数据集。我们将评估整合策略对潜在代表的影响,并结合提出一种新方法的最佳策略(https://github.com/hakimbenkirane/customics)。我们在这里关注来自多个OMIC来源的数据的集成,并证明了针对多个任务(例如分类和生存分析)的测试用例的拟议方法的性能。
translated by 谷歌翻译